热线数据“穿透式”分析助力征管服务提质增效的实践与思考——基于山东省的调查
作者:
胡苏华(国家税务总局山东省税务局)
“穿透式”分析是一种数据分析方法,以每个月的税费服务热线数据为分析对象,通过一号归集、多维关联等手段对热线数据进行深入剖析,以穿透分析征管服务质量。国家税务总局山东省税务局在全国较早开展了热线数据“穿透式”分析,在热线数据“穿透式”分析中进行了丰富的探索和实践。为进一步提升数据效能,山东省税务局以高质量开展好主题教育为契机,充分运用互联网、大数据等现代信息技术,采用座谈交流、问卷调查、书面调研等方式,围绕山东省每月近50万通的纳税人缴费人政策和操作咨询、投诉举报、建议意见等热线数据,组织“穿透式”分析常态化调研。为了提高调研的科学性和实效性,山东省税务局构建起以一号归集、多维关联为主要特征的“穿透式”分析应用机制,通过深挖热线数据背后隐藏的纳税人缴费人涉税费行为习惯和税收征管质量问题,谋划务实举措,建立“数据—调查—研究—改进”工作闭环,进一步推动税费服务和征管质量不断提升。
调研发现,随着税收大数据在税收工作、经济运行研判以及社会管理等领域的深层次应用,税务部门在深化数字化理念和认识、完善税收大数据分析应用制度机制、加强分析平台建设等方面还存在一些问题和挑战。
(一)数据理念融入管理服务的意识不到位
大数据分析运用不仅是信息技术革新的体现,更预示着税收工作理念的转变,必将对税收征管工作产生深刻而广泛的影响。税费服务热线经过多年的发展完善,得到了社会公众的普遍认可和专业机构的较高评价,但是在热线数据的应用中,各级税务机关和税务干部对热线数据在税费服务、税收征管、决策参考中的意义认知仍然有限,总体认识水平有待于进一步提高,需加强宣传和引导,进一步提升税务机关和税务干部对热线数据战略与相关技术的重视程度,从更深层次认知热线大数据。比如,在热线数据“穿透式”分析初期,山东省168个县级税务机关来电偏离率标准差为27.52,地区间来电管控水平差异较大,政策类问题占比41%,系统操作类问题占比58%,重复性的系统操作类问题依然较多,因此在内部管理提升、外部服务提效两方面上都需要加强数据驱动改革创新。
(二)数据分析应用缺乏有效制度机制保障
税费服务热线作为税费服务体系中的重要一环,如果缺少对应的分析应用制度体系,不利于热线数据效能发挥。通过实地和问卷调研情况看,热线数据“穿透式”分析开展之前,山东省税务系统包含1个省级中心、5个分中心在内的12366税费服务热线,包含15个中心在内的电子税务局技术支持热线,以及168个县(市、区)税务局的办税服务厅对外公开热线,在实际运行中更多关注热线的接通率、答复准确率等即时指标,对热线的相关数据分析主要目的是合理安排坐席班次、分析纳税人缴费人咨询关注热点等热线运行方面,没有形成比较统一的指标体系,在分析的深度、广度、关联度方面都需要加强。此外,近几年税务部门对于税费服务热线的相关研究,也主要集中于热线运行层面,对热线数据后续的分析应用、热线数据分析配套制度机制建设,以及利用热线数据指导征管和服务工作、利用热线数据为税务决策提供参考从而提升整体工作的关注度不够,缺少相关理论支撑和配套措施,在制度层面也没有形成一定的体系。
(三)数据智能化分析的平台支撑还不完善
中共中央办公厅、国务院办公厅印发的《关于进一步深化税收征管改革的意见》(以下简称《意见》)指出,要加强智能化税收大数据分析,不断强化税收大数据在经济运行研判和社会管理等领域的深层次应用。如何采集、存储、分析、利用庞大的涉税数据,进而从海量的数据中挖掘有价值的信息,是税收信息化建设面临的一个重大课题。特别是热线数据纷繁复杂,目前在形成统一、规范的元数据方面还比较粗略,没有形成较为完善的热线数据标签体系、分析指标体系、纳税人缴费人行为习惯指标体系,加之系统间数据交互渠道不够通畅,很多数据之间仍存在“信息孤岛”问题,数据难以得到及时、有效利用,也很难在热线数据分析的自动化、智能化、结构化方面建立支撑体系,更缺少系统平台支撑,在挖掘热线大数据、增值热线大数据方面存在短板。比如,在来电数据的分析口径上,传统分析手段集中于对来电人所属地区的分析,在来电人规模、身份方面,既缺乏有效的分析标签,也缺少有效的分析手段。在传统分析阶段,还没有形成智能化、自动化的数据汇集、分析平台,利用人工手段进行分析存在滞后性。
二、热线数据“穿透式”分析的实施路径
以山东省税务局为例,山东省作为热线咨询大省,12366热线、96612366(电子税务局技术支持热线)等税费服务热线年均服务量达600万通以上,海量数据背后蕴含着管理服务工作方向。山东省税务局聚力数据归集、穿透分析、深化应用的“三步走”路径,在热线数据“穿透式”分析中进行了丰富探索和有效实践。
(一)数据归集阶段
热线数据“穿透式”分析的基础是实现热线数据的大集中,构建标准统一、运转高效的热线数据指标体系和数据模型,从而实现热线数据“一户式”“一人式”“一局式”归集。数据归集是深化数据应用的重要支撑。
1.构建指标体系。
(1)健全指标体系。健全的热线数据指标体系是做好分析的基础。山东省税务局针对热线服务特点,从“问、答、管、用”四个层面,构建热线服务“4A”(Ask、Answer、Admin、Application)评价指标体系,同时从政策触达、办理流程、征收管理、系统应用、服务效能、问题需求等6个归类维度,创建6大类4个层级275个来电指标体系和26个量化指标,给每通来电“把好入口关”。
(2)完善专属标签。针对重点时间、节点,以及重要的工作事项,建立热线专属分析标签。比如,在个人所得税综合所得汇算清缴、企业所得税汇算清缴、社会保险集中征缴期、税费优惠政策实施期等重点热点期间,增加专属标签,实现全量来电数据的分类分层归集和与各类征管服务事项的关联穿透,做到每通来电都能“画好入口像”。
2.完善数据模型。
(1)构建“三分式”分层模型。针对建制县(市)、市辖区、开发区纳税人缴费人的规模、类型、行业差异较大的情况,对168个县(市、区)税务局按照行政区划性质,划分为建制县(市)、建制区、开发区等3个类型,分别归集数据和计算指标。
(2)构建“一号式”归集模型。以号码为起点开展数据归集和业务建模,对每月近50万通热线的来电号码与核心征管、实名办税、自然人税收管理、社会保险缴费管理4个系统数据进行关联聚合,构建“号码—人员—税户—主管税务机关”模型,解决了以往热线数据分析中来电号码无法细分到户、到人,来电量无法匹配至管理分局(所)的难题,实现所有来电记录关联穿透至具体纳税人缴费人、具体管理分局(所)。在数据建模基础上,对热线运行涉及的来电量、来电频次、问题类型、税户、自然人、行业分布、企业划型、主管税务机关等信息运用大数据OneID技术实现“一号式”归集。
(二)“穿透式”分析阶段
综合运用多维关联、回归分析等手段,开发“偏离率”模型,测算“来电当量”和“问题当量”,通过对比分析实际量与应当量的离散情况,客观评价所在区域热线整体运行情况。在此基础上,准确定位各地咨询量较大、类型较为集中的共性和个性问题,深度分析热线数据背后涉及的基础征管、宣传辅导、税源管理、涉税中介等影响因素,建立纳税人缴费人行为习惯特征库和政策偏好特征库,为靶向施策打好基础。
1.来电偏离率。来电偏离率指实际来电量偏离来电当量的程度。其中,来电当量指一个单位或地区合理的来电量。
计算公式:
计算步骤:按照行政区划设置情况,对全省168个县(市、区)税务局按建制县(市)、建制区、开发区3类行政区划划分。对每类行政区划下的来电记录,按企业划型、行业大类进行两次分类,计算户均来电量,即先将来电量按企业划型分类,再将每一类划型按行业大类分类,然后计算每个企业划型下每个行业大类的户均来电量。其中,企业划型结果共6个,行业大类共98个。将计算得出的划型行业户均来电量乘以同口径的管户数量,聚合累加后即得出一个单位的来电当量。
2.问题偏离率。问题偏离率指实际咨询问题量偏离问题当量的程度。其中,问题当量指一个单位或地区合理的咨询问题量。
计算公式:
计算步骤:建立275个来电问题标签,同时按照行政区划设置情况,对全省168个县(市、区)税务局按建制县(市)、建制区、开发区3类行政区划划分。对每类行政区划下的来电问题记录,按企业划型、行业大类进行两次分类,计算户均来电问题量,即先将来电问题量按企业划型分类,再将每一类划型按行业大类分类,然后计算每个企业划型下每个行业大类的户均来电问题量。其中,企业划型结果共6个,行业大类共98个。将计算得出的划型行业户均来电问题量乘以同口径的管户数量,聚合累加后即得出一个单位的来电问题当量。
(三)深化应用阶段
1.夯实“分级式”应用机制。明确“穿透式”分析业务流程和服务举措,建立“1+3+N”分析应用机制,即:“1”为一级分析,省局每月对全系统热线数据开展“穿透式”分析;“3”为在纵向上,实现分析结果省局、市局、县(市、区)局三级共享,省局按月发布《服务热线数据分析报告》,指标排名、分析结论直接下探到168个县(市、区)局,通过三级联学方式,每月对分析报告进行解读辅导,促动主管局及时响应、处理管理服务问题;“N”为在横向上,实现分析结果由纳税服务、税收征管、风险管理、税费种管理等多部门共用,共同应对热线数据反映的税收征管服务弱项,进一步提升税收工作质效。
2.建设“智慧式”支撑平台。大数据时代的税收征管工作是一项动态、有序的系统工作,平台的支撑具有基础性、保障性作用。山东省税务局适应税收工作改革与发展形势需要,借助税收大数据云平台创新热线数据分析方式,将来电质效、数据质量,以及涉税中介机构来电质效等分析内容嵌入平台,开发3大类17项分析指标,将大数据融入日常税收服务,对内深化数据分析应用,对外推进数据共享治理,实现热线数据的自动汇集、智能分析、实时管控。
3.优化“多维式”指标体系。数据模型、指标算法快速迭代,促进指标体系不断优化完善。山东省税务局持续组织人力投入技术开发,加快数据模型、指标算法迭代更新,通过视频培训、现场座谈等方式广泛征集意见建议,不断调整和优化指标体系。2022年7月,针对来电偏离率算法中计算维度单一的问题,引入企业划型分层,优化后的来电偏离率指标更加科学,指标维度更加丰富。2022年9月,在来电量分配算法中增加了号码匹配顺序,优化后来电人身份中的“三员”占比从58%提高到84%,号码归属地判定更加精准。
4.加强“过程式”热线管理。将热线管理纳入山东省智慧税务建设体系统筹实施,省局、市局、县(市、区)局三级对照热线数据“穿透式”分析报告及指标排名,坚持问题导向,畅通热线管理上下联动机制,狠抓热线服务各项管理,实现来电偏离率等主要指标持续优化提升,地区间来电管控水平差异逐步缩小,热线服务质效实现快速提升。
2022年7月至12月的热线数据显示:热线来电量月均下降3.34%;平均通话时长从2.48分钟降至2.1分钟;连续6个月连续咨询数量同比下降1.09%;服务评价提升,好评率全部在99.95%以上。通过靶向宣传,2022年12月,增值税类咨询环比下降62.39%,个人所得税类咨询环比下降61.39%,社会保险费类咨询环比下降49.05%,印花税类咨询环比下降71.87%。开展热线数据“穿透式”分析以来,频繁拨打热线的纳税人缴费人热线咨询量不断下降,反映出纳税人缴费人的涉税费需求在“穿透式”分析的应用中得到较好满足。
(一)“全程式”反哺征管,精确执法更有力度
山东省税务局深入剖析指标变动背后涉及的基础征管、宣传辅导、税源管理、涉税中介、队伍建设等影响因素,推动税收治理能力不断提升,形成征管和服务“诉求分析、完善举措、持续提升、跟踪问效”的螺旋式提升和齿轮咬合式传动。同时,将热线“穿透式”分析偏离率指标与税收征管质量监控评价指标体系协同管理,推动征管服务质效从重结果向重过程、粗放式向精细化转变。热线数据“穿透式”分析实施以来,5C、5R监控类指标实现了整体提升。
(二)“预先式”行为洞察,精细服务更有温度
山东省税务局通过对纳税缴费行为习惯的洞察分析,主动改变税费服务供给模式,有效落实《意见》提出的“深入推进对纳税人缴费人行为的自动分析管理”要求。一方面,建立组合式税费支持政策“微颗粒化”政策标签库,对政策条款按照享受条件进行最小颗粒度分解,通过与企业登记信息、经营信息、申报信息及第三方信息比对关联,实现供需双向精准触达、纳税人缴费人快速获取真正需要的政策。另一方面,根据纳税人缴费人行为习惯、政策偏好与税费优惠政策和服务资源的关联匹配情况,对行业性、区域性纳税人缴费人关注重点,提前预判热点问题、新增业务问题,通过电子税务局、征纳互动平台等服务渠道,为纳税人缴费人提供“想即所得”的直达式服务。例如,通过政策触达指标穿透分析增值税留抵退税高频问题,从“人找政策”向“政策找人”转变,将留抵退税政策特征标签与适用纳税人进行关联匹配,2022年推送政策动态提醒11 539户次,退税金额达57.06亿元。
(三)“模板式”事前提醒,精准监管更有深度
山东省税务局通过税收违法行为举报等指标穿透分析问题多发的行业、地区和人群,从事后打击向事前事中精准提醒转变。目前已经先后推广皮毛、板材、水产品等22个行业税收管理模板,推送政策动态提醒30.93万户次。针对涉税中介机构和代理记账人员咨询设置独立标签和量化指标,通过热线数据与涉税专业服务机构采集信息、市场监管部门信息、财政部门信息、税务登记信息的“五个比对”,摸清涉税中介机构底数。针对“穿透式”分析暴露出的金税三期系统中法定代表人、财务负责人、办税人员“三员”联系电话不实的问题进行核实,更正基础数据3.2万条,有效提升了征管基础数据质量。
(四)“链路式”网格联动,精诚共治更有广度
山东省税务局将数据分析结果应用纳入“综治+税治”双网格联动工作机制,针对分析发现的涉及税收服务、征管资源占用较高的不动产租赁、社会保险费缴纳等热点问题,引入社会“综治”服务体系,通过“‘网格’+‘宣传、问需、处置’”,依托社会力量实现服务前置,有效分流服务压力。目前,山东省已建立137个县级双网格领导小组,由3 855个税务网格与11 152个社会网格协同开展工作,以数据赋能“网中有格、格中有员、岗责明晰、双向联动”的基层综合治税新模式。
山东省税务局在热线数据“穿透式”分析以及应用调研中,提炼总结了“一二三四”实践经验,对于税务部门深化税收大数据共享应用、助力征管服务提质增效具有一定借鉴意义。
(一)把握一个理念,深化征管服务数字化应用
热线数据“穿透式”分析作为一种工作理念和工作方法,较好地落实了数字素养提升和以数治税要求。在与纳税服务、税收征管、风险管理、社会保险等不同岗位的税务干部和不同规模、不同行业的纳税人缴费人座谈交流中发现,除应从热线数据角度对征管服务进行分析外,在风险应对、优惠政策落实等多方面也应加强“穿透式”分析理念运用。比如:对于基层税务机关反映的税收风险难防控问题,对异常凭证核查的上、下游企业及整个产业链进行“穿透式”分析,深入比对资金流、发票流、货物流、合同流“四流合一”情况,实现风险分析应对闭环管理,同时通过加强对“重点行业和领域税收监管”跟踪调研,分析支柱行业、特色行业、热点行业、高风险行业特点,形成了板材加工等8个重点行业和领域风险管理模板、91个风险分析指标,有效指导基层税务机关开展风险分析和风险应对;在社会保险费(非税收入)征收、不动产交易等环节践行“穿透式”管理理念,强化数据共享和业务协同,打破部门间的业务壁垒,通过窗口整合、人员融合和服务聚合,实现“一窗受理、部门流转、提速办结、一窗出件”,解决实地调研中发现的纳税人缴费人急难愁盼问题。
(二)推进“两化”转型,加快智慧税务建设
金税工程基本完成税务部门党务、政务、业务信息化架构整合,迈出税收征管数字化升级、智能化改造的关键一步。在办税服务厅和税务管理分局(所)等基层单位蹲点调研发现,广大基层税务机关和税务干部对建成以服务纳税人缴费人为中心、以发票电子化改革为突破口、以税收大数据为驱动力的具有高集成功能、高安全性能、高应用效能的智慧税务具有很高期待。税务部门应以税收征管数字化升级、智能化改造“两化”转型为契机,进一步拓展大数据和人工智能技术运用,积极推进热线数据分析向“两化”转型,深入推进对纳税人缴费人行为的自动分析管理、对税务人员履责的全过程自控考核考评、对税务决策信息和任务的自主分类推送,持续推进纳税缴费服务措施从理念、方式到手段上的变革,为纳税人缴费人提供更加优质便捷的服务,进一步提高税法遵从度和社会满意度。
(三)贯彻“三端”理念,重构税收业务体系
贯彻好纳税人缴费人端、税务人端、决策人端“三端”工作理念。在纳税人缴费人端,坚持“以人民为中心”发展思想,着力提升热线数据应用看数、知数、用数“三项能力”,将纳税人缴费人的合理需求与热线数据应用目标结合起来,建立“数据—洞察—改进”快速通道,缩短从纳税人缴费人需求产生到服务端作出改进的周期,促进“四精”要求落地转化;在税务人端,善于运用集成思维,统筹处理好指标管控与优化服务、提升征管质效之间的关系,利用“穿透式”思维从根源上寻找原因解决问题;在决策人端,要把税收大数据分析提升到服务“国之大者”的高度,聚焦党的二十大和中央经济工作会议部署,坚持发挥“以税咨政”作用,将数据分析、调查研究工作同服务地方党委政府决策紧密结合起来,找准分析选题,提高分析能力和水平,为决策提供更多、更有价值的分析报告。
(四)落实“四个共享”,促进资源优化配置
《意见》指出,要深化税收大数据共享应用。以热线数据为代表的税收数据分析是一项专业性、技术性很强的工作,在数据分析过程中,落实数据共享、过程共享、结果共享、荣誉共享“四个共享”理念,持续优化人才、数据、技术等资源配置十分重要。特别是税务机关职责从“税主费辅”到“税费皆重”、服务对象从“以法人为主”到“法人和自然人并重”、征管效能从“经验管税”到“以票管税”再到“以数治税”,对税收工作提出了新要求。因此,建立一批技术更专业、执行更精准的高素质专业化队伍,成立跨部门分析团队,形成横向协同、上下互动的分析工作格局尤为重要。同时,要借鉴“破解跨部门数据共享难题”对策性调研形成的建立健全数据共享机制成功实践,推进与有关部门信息系统互联互通,建成税务部门与相关部门常态化、制度化数据共享协调机制,健全涉税涉费信息对外提供机制,打造规模大、类型多、价值高、颗粒度细的税收大数据,高效发挥数据要素驱动作用。
(本文为节选,原文刊发于《税务研究》2023年第8期。)
欢迎按以下格式引用:
胡苏华.热线数据“穿透式”分析助力征管服务提质增效的实践与思考:基于山东省的调查[J].税务研究,2023(8):23-28.
-END-
●增值税如何“减”更有利于实现共同富裕——兼论深化增值税制度改革的减税收入再分配“效率”
●提高税收确定性的路径选择——基于IMF和OECD《税收确定性专题报告》的启思
●纳税争议行政复议申请期限问题研究——以A公司不予受理行政复议案为例
●税收犯罪中刑事没收的裁判分歧与理论匡正——以1 800份逃税罪裁判为例